logo

1 Introduction

1.1 Objectif

Ambition : proposer un cadre de vie dans lequel les flux cyclistes sont sécurisés et des moyens sont mis en oeuvre pour systématiquement réduire l’occurrence d’accidents impliquant des cyclistes

Analyse a posteriori : Identifier les zones accidentogènes d’un territoire pour les cyclistes à travers l’analyse des flux et des caractéristiques des lieux d’accident

Analyse a priori : identifier les zones susceptibles de présenter des caractéristiques accidentogènes sur la base de l’analyse a posteriori

Reproductibilité : Proposer un modèle d’analyse générique pour permettre de réaliser l’évaluation d’un territoire par une collectivité, une association ou des usagers avertis avec comme objectif de proposer des évolutions de la voirie susceptible de réduire l’accidentologie

1.2 Besoins

T1 - Définir les caractéristiques types des zones accidentogènes à travers l’analyse fine de la voirie, des flux, de la météo et de toutes propriétés discriminantes

T2 - Identifier les zones d’un territoire géographique susceptible de présenter des critères accidentogènes sur la base de ces critères

Data > Produire un module d’analyse open-source, documenté et partagé pour les zones accidentogènes.

Communication > Promouvoir le modèle d’analyse à travers un site internet, un github et des outils de communication à destination des cibles identifiés

1.3 Cibles

1- Les collectivités pour les aider à prioriser les investissements dans les équipements de sécurisation de voirie des flux cyclistes sur leurs territoires.

2- Les associations de cyclistes pour analyser les territoires et appuyer leurs plaidoyers pour demander des évolutions des pratiques des collectivités

3- Les fournisseurs de service d’itinéraires cyclistes pour intégrer le contournement de zones identifiables comme plus accidentogènes dans leurs calculs

2 Analyse de données

2.1 Analyse descriptive

2.1.1 Analyse des variables de la table usagers_epci

## [1] 548

Nous avons pris les informations de la table usagers_epci pour les accidents qui sont dans la table Accidents_velo_epci_sf. Ainsi, notre étude se concentre sur les accidents de vélo et nous excluons les accidents qui ne concernent que les voitures, piétons, …. Nous avons donc une table merged_usager qui contient cela.

Avec “length(unique(merged_usager$Num_Acc))”, on se rend compte que cette table merged_usager contient tous les accidents, et pour chaque accident on a au minimum 1 individu en vélo impliqué. Les autres individus peuvent être en voiture, en transport en commun ou bien à pied.

2.1.1.1 Variable trajet

2.1.1.1.1 Graphique du nombre d’accidents en fonction du motif de déplacement

On se rend compte que les accidents impliquant un vélo se déroule souvent lors de loisirs ou de promenade.

2.1.1.1.2 Graphique du nombre d’accidents en fonction du motif de déplacement et de l’heure

Nous pouvons observer grâce à ce graphique que les accidents se déroulent plus souvent lors de trajet “Domicile-travail” vers environ 9h du matin et lors de trajet de “promenade-loisirs” vers 19h ce qui coincident avec la réalité. En effet, la plupart des individus partent au travail vers 8h, 9h et peuvent faire leurs loisirs après la sortie de leurs travails, donc vers 18h, 19h.

2.1.1.2 Variable Locp

## 
##  -1   0   1   2   3   4   5   8   9 
##  75 950   1   6   3   5   6   1   2

La plupart des localisations des piétons sont “sans objet” (correspond au 0), ce n’est donc pas très utile d’en tirer de l’information.

2.1.2 Analyse des variables de la table Accidents_velo_epci_sf

Observons le nombre d’accident par mois de 2005 à 2021, sur Montpellier Méditerrannée Métropole (MMM). Nous observons un pic du nombre d’accidents au mois de Septembre. Nous pouvons faire l’hypothèse que c’est la période où il y a le plus de cyclistes, car c’est le début de l’année scolaire, et que les jours sont encore assez chauds. On remarque un faible nombre d’accident durant tous les mois d’hiver. Nous faisons l’hypothèse qu’il y a une baisse du nombre de cycliste en automne-hiver. Le mois d’août est le troisième mois le plus faible, c’est la période où la plus grande partie des gens est en congé, donc la circulation est plus faible.

Ce graphique montre bien l’évolution du nombre d’accident au cours des mois. Nous supposons que le nombre d’accident est lié au nombre de cyclistes.

Observons le nombre d’accident par mois pour chaque année, de 2005 à 2021, sur MMM. Nous pouvons sélectionner un seul mois ou plusieurs pour mieux les comparer. On peut ainsi voir qu’il y a des mois qui sont au de-dessus d’autres, pour toutes les années confondues (septembre est toujours au dessus d’août, ou équivalent). Aussi, Certains mois ont une très grande variabilité suivant les années. C’est le cas du mois d’avril par exemple.

Nous avons supposé que la luminosité au moment de l’accident peut être un facteur déterminant. Nous observons sur ce graphique que la très grande majorité des accidents a lieu en plein jour. En effet, c’est en plein jour qu’il y a le plus de cyclistes, et le plus d’automobilistes. C’est ensuite la nuit avec éclairage public allumé qu’il y a autre partie des accidents. C’est sans doute car les accidents ont majoritairement lieu en ville.

Observons les heures des accidents. On constate les pics d’accidents aux horaires de pointe : 8h-9h et 17h-18h. C’est en effet l’heure où il y a le plus de circulation. La nuit, il n’y presque pas d’accident (comme le montrait aussi le graphique précédent).

Nous avons aussi regardé quelle est la part des accidents entre l’agglomération et hors de l’agglomération. On peut facilement voir que la plus grande part des accidents a lieu en agglomération.

Grâce à ce graphique à double échelles, nous pouvons comparer les accidents entre agglomération et hors agglomération. Ce qui est intéressant est de regarder si les pics ont lieu aux mêmes horaires. Or comme nous l’avions déjà observé précédemment, en agglomération, le pics d’accient à lieu aux heures de pointe (8h-9h et 17h-18h). En revanche, hors agglomération, le pic a lieu dans la matinée vers 11H. Nous pouvons supposer que cela concerne plutôt des déplacments de types loisirs, et à des heures ou la circulation automobile est faible.

Analysons les types d’intersections sur le lieu des accidents. On se demande si les accidents ont lieu sur des routes sans intersection ou bien sur des intersections. On oberve que le plus grand nombre d’accident a lieu sur des routes hors intersection.

Toutefois, on a une variable Hors interection mais plusieurs variables décrivant les différents types d’intersections. On fait la comparaison entre les accidents hors intersection et les accidents ayant lieu sur tous types d’intersection .

Une fois que les différents types d’intersections sont rassemblés en une seule colonne, on voit que l’écart est nettement plus faible. Les accidents hors intersection restent majeurs.

2.1.3 Analyse des variables de la table lieux_epci

Observons les différentes catégories de routes sur le lieu d’accident. On voit que la plus grande part des accidents a lieu sur des routes communales. Cela englobe toutes les voies qui appartiennent au domaine public routier communal. Ce sont les routes que nous empruntons chaque jour en ville. Comme leur nom l’indique, les routes communales se trouvent en agglomération. C’est donc cohérent par rapport au fait que la plus grande majorité des accidents a lieu en agglomération.

2.1.4 Méthode du chi-carré

2.1.4.1 Initialisation de la table tags

Nous possédons les informations de OpenStreetMap dans une table et elle se nomme “Tampon_Accidents_velo_osm_sf”. Elle contient pour chaque tampon, donc pour chaque zone de 30 mètres autour de chaque accident, des informations sur la limitation de vitesse, le type de route, etc….

On va donc, pour pouvoir analyser ce jeu de données:

Nous constatons que la table “Accidents_velo_tags_osm” est consitutée d’individus (accidents) et de 300 variables (les tags). Chaque variable est binaire et prend 1 si l’individu possède la variable, 0 sinon.

2.1.4.2 Sélection de variables (de tags)

Pour faire le test de Khi-2 sur des paires sur toutes les variables, j’ai eu besoin de diminuer le nombre de variable pour limiter le temps d’exécution. J’ai donc limiter le choix des tags en fonction de s’ils appraisssaient au minimum 10 fois chez les accidents. Je me retrouve donc avec 49 tags.

De plus, j’ai trié les tags aussi en fonction de ceux étant les plus pertinents pour l’analyse et il me reste donc 34 tags.

2.1.4.3 Mise en place du chi-carré

Nous pouvons observer les premières paires les plus significativement liées.

Les tags sélectionnés pour faire les paires ne correspondent qu’aux tags qui apparaissent dans chez au moins 10 accidents, et qui sont les plus pertinents à étudier.

Interprétation: il y a plus d’accident dans un tunnel lorsqu’il y a un bon niveau de cyclabilité.

Voici la source de toutes les descriptions des différents tags: OpenStreetMap Taginfo

2.2 Analyse en Composantes Principales (ACM)

2.3 Zone accidentogène

2.3.1 Analyse et cartographie des accidents et des pistes cyclables avec leurs limitations de vitesse

2.3.1.1 Graphique

Nous pouvons constater qu’il y a plus d’accidents en vélo lorsque la limitation de vitesse est de 50.

Nous pouvons supposer que c’est en ville qu’il y a le plus d’accidents, là où la route est limitée à 50 km/h. Les zones limitées à 5 km/h correspond aux zones piétonnes donc il y a peu de chances qu’il y est des accidents. De plus, sur les routes limitées à 70 et 80 km/h, on ne trouve que peu de cycliste donc il n’est pas étonnant de voir qu’il y a moins d’accident.

2.3.1.2 Carte des pistes cyclables

2.3.2 Les zones accidentogènes à Montpellier

Notre but ici va être de créer un dataframe contenant toutes les informations de Montpellier grâce aux nombreux tags présents dans la métropole, proposé par OpenStreetMap. Chaque élément que nous donne OpenStreetMap est sous la forme d’une géometrie “ligne” qui contient un ou plusieurs tags. Ces tags peuvent donc apparaître plusieurs fois, pour plusieurs élément de OpenStreetMap. Nous précisons que nous avons filtré le choix des tags en fonction des tags sélectionnées précedemment, c’est-à-dire ceux qui apparaissent au moins 10 fois chez les accidents mais aussi les tags les plus pertinents pour notre étude.

2.3.2.1 Initialisation de la table avec les informations d’OpenStreetMap

Voici le dataframe contenant tous les tags qui existent à Montpellier en fonction de notre sélection de tag.

Nous pouvons observer “osm_id” qui est l’identifiant donné par OpenStreetMap et qui correspond à un endroit géographique contenant plusieurs informations (tags). La colonne “other_tags” montre les tags dans chaque “osm_id” et la dernière colonne “geometry” est le point sur lequel se trouve l’ensemble des informations. Nous pouvons rajouter que la colonne “geometry” contenait des lignes à la place des points comme dit précedemment. Pour réaliser la densité des points par la suite afin de définir les zones accidentogènes, nous avons pris le centroide de la ligne car les lignes étaient toutes petites et nous l’avons donc pris comme point.

Cette carte montre bel et bien les différentes zones accidentogènes. On remarque que le centre ville est l’endroit où il y a le plus d’accident. De plus, en zoomant, notre analyse se valide en remarquant que ces zones sont principalement près des intersections et près des lignes de trams.